| Ano | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 | 2024 |
| TMI | 3.15 | 3.31 | 2.67 | 2.71 | 2.83 | 2.51 | 2.21 | 2.31 | 2.49 | 3.20 |
Mortalidade infantil em Portugal Continental 2015-2024
Análise Bayesiana espaço-temporal com INLA
O objetivo desta análise é avaliar a evolução espacial e temporal da mortalidade infantil em Portugal Continental ao longo da última década (2015-2024). A partir de dados publicados pelo Instituto Nacional de Estatística referentes ao número anual de óbitos durante o primeiro ano de vida e número anual de nados-vivos por concelho, analisou-se o risco relativo de mortalidade infantil utilizando modelos hierárquicos Bayesianos com aproximação de Laplace (INLA). Os modelos incorporam efeitos espaciais estruturados e não-estruturados (BYM2), efeitos temporais (RW1), e uma covariável socioeconómica (Índice Europeu de Privação, EDI). Entre 2015-2021 observou-se um declínio generalizado na mortalidade infantil, que atingiu o valor mínimo nacional em 2021. No entanto, desde então a tendência inverteu-se, com aumentos significativos em alguns concelhos. Esta análise identifica concelhos com riscos relativos significativamente elevados (e.g., Barreiro, Amadora) e padrões de heterogeneidade espacial associados à privação socioeconómica.
mortalidade infantil, risco relativo, análise espaço-temporal, modelos Bayesianos, INLA, mapas de doenças, Portugal
1 Dados
Para analisar a evolução espaço-temporal da mortaliade infantil em Portugal desde 1 de janeiro de 2015 a 31 de dezembro de 2024, foram usados os dados seguintes, fornecidos pelo Instituto Nacional de Estatística :
- Óbitos de menos de 1 ano (N.º) por concelho, por ano;
- Nados-vivos (N.º) por concelho de residência da mãe.
Para além destes dados foram também usados os dados do European Deprivation Index 2011 - EDI. O EDI é um índice ajustado para Portugal1 que serve de indicador sobre o grau de privação socio-económica em cada concelho. Valores mais altos deste índice estão associados a concelhos com maior grau de privação socio-económica. Os dados do índice serviram para explorar diferenças na mortalidade infantil por concelho e ano, controlando o efeito do grau de privação.
A informação geográfica com o mapa de Portugal usado para realizar a análise espacial por concelho é fornecido em formato digital (shapefile) pela Direção Geral de Saúde2.
2 Métodos
2.1 Risco relativo
As estimativas das taxas de mortalidade infantil por concelho podem ser extremamente variáveis devido ao efeito de escala (em concelhos com populações de dimensão reduzida as taxas tendem a ser mais instáveis e a incerteza associada tende a ser maior). Por isso, neste estudo, estima-se o risco relativo (RR) de mortalidade infantil por concelho em vez da taxa de mortalidade, porque esta é invariante à escala. Esta abordagem permite atenuar o efeito das populações de dimensão reduzida nas estimativas do RR, através de modelos de regressão aditivos que incorporam efeitos espaciais e temporais estruturados, e partilham informação entre concelhos vizinhos.
Em alguns dos modelos a especificar será adicionada a covariável EDI, para avaliar o impacto dos efeitos espaciais e temporais na variação do RR controlando o efeito do grau de privação socio-económica.
2.2 Regressão Bayesiana
A modelação espaço-temporal é baseada na regressão Bayesiana. A inferência dos parâmetros e dos hiperparâmetros é realizada de acordo com a aproximação INLA (Integrated Nested Laplace Approximation3). Esta estratégia assenta numa simplificação (os modelos podem ser expressos como processos estocásticos gaussianos latentes de Markov ) que permite explorar a estrutura esparsa da matriz de precisão, possibilitando aproximações determinísticas rápidas e precisas das distribuições marginais posteriores.
O modelo inclui efeitos fixos para a ordenada na origem e para o EDI como covariável explicativa. Os efeitos aleatórios incorporam três componentes: uma componente espacial modelada através do modelo BYM2 (Besag-York-Mollié) que combina variação espacialmente estruturada, capturando a dependência entre concelhos adjacentes, e variação não estruturada; uma componente temporal representada por um passeio aleatório de primeira ordem, que captura a evolução temporal ao longo do período analisado; e uma componente de interação espaço-temporal.
Os hiperparâmetros de precisão foram modelados com distribuições à priori de penalização de complexidade (PC priors), favorecendo modelos menos complexos (mais simples) e permitindo incorporar conhecimento prévio sobre a importância esperada da variabilidade espacial e temporal.
2.2.1 Modelo
O modelo usado neste estudo é um modelo aditivo generalizado com distribuição de Poisson e função de ligação canónica (log):
\[ Y_{ij}\sim \text{P}\big(E_{ij}\theta_{ij}\big) \]
onde \(Y_{ij}\) representa o número de óbitos com menos de um ano de vida observados no concelho \(i\) no ano \(j\), \(E_{ij}\) representa o número de óbitos esperados no concelho \(i\) no ano \(j\) (offset) se a taxa de mortalidade infantil fosse a da população de referência e \(\theta_{ij}\) representa o RR de morrer durante o primeiro ano de vida no concelho \(i\) no ano \(j\).
Exploraram-se diferentes especificações para modelar \(\log(\theta_{ij})\) (em vez de \(\theta_{ij}\) usa-se a função de ligação canónica \(\log(\theta_{ij})\) da distribuição de Poisson, por causa da relação linear com os preditores, no contexto dos modelos aditivos generalizados):
\[\begin{align} M1: \log(\theta_{ij})&=\alpha+\beta t_j \\ M2: \log(\theta_{ij})&=\alpha+u_i+v_i+(\beta+\delta_i)* t_j \\ M3: \log(\theta_{ij})&=\alpha+u_i+v_i+\gamma_j + \phi_j \\ M4: \log(\theta_{ij})&=\alpha+u_i+v_i+\gamma_j + \phi_j + \delta_{ij}\\ M5: \log(\theta_{ij})&=\alpha+u_i+v_i+(\beta+\delta_i)* t_j + \beta_{\scriptsize\text{EDI}} \times \scriptsize\text{EDI}_i \\ M6: \log(\theta_{ij})&=\alpha+u_i+v_i+\gamma_j + \phi_j + \beta_{\scriptsize\text{EDI}} \times \scriptsize\text{EDI}_i \\ M7: \log(\theta_{ij})&=\alpha+u_i+v_i+\gamma_j + \phi_j + \delta_{ij} + \beta_{\scriptsize\text{EDI}} \times \scriptsize\text{EDI}_i \end{align}\]
Onde:
- \(\alpha\) representa a ordenada na origem;
- \(\beta\) representa a tendência linear temporal (impacto global, i.e., independente do concelho);
- \(t_j\) representa o índice temporal correspondente ao ano \(j\);
- \(u_i\) representa a componente espacial estruturada;
- \(v_i\) representa a componente espacial não-estruturada, i.i.d com distribuição \(\text{N}\sim (0,\sigma_v^2)\);
- \(\delta_i\) representa o impacto linear do tempo em cada concelho (impacto local);
- \(\gamma_j\) representa a componente temporal estruturada no tempo (i.e. autocorrelacionada);
- \(\phi_j\) representa a componente temporal não-estruturada, com distribuição \(\text{N}\sim (0,\sigma_\phi^2)\);
- \(\delta_{ij}\) representa um termo de interação dos efeitos espaciais e temporais não-estruturados;
- \(\beta_{\scriptsize\text{EDI}}\) representa o efeito associado à covariavel indice EDI.
Os termos \(u_i\), \(v_i\), \(\gamma_i\) e \(\phi_i\) são funções (especificadas por priors, conforme se apresenta na secção seguinte) que estimam os efeitos estruturados e não-estruturados (ou aleatórios) das componentes espacial e temporal.
O ajustamento destes modelos com nível de complexidade crescente mostrou-se útil para a exploração dos dados. Partindo de um modelo temporal de tendência linear global (M1) adicionaram-se as componentes espacial e temporal com efeitos estruturados e não-estruturados (M2-M3), a interação entre ambos (M4) e ainda o impacto destas componentes controlando o efeito do indice de privação socio-económico (EDI) (M5-M7).
Toda a análise estatística foi realizada em linguagem R4 com o package INLA5.
2.2.2 Priors
Para a especificação das priors tomou-se em consideração a redução acentuada e consistente na mortalidade infantil observada desde a decada de 1970 (dados Pordata6). O aumento da taxa a partir de 2021 leva a considerar uma variação temporal e espacial do risco relativo com variabilidade moderada.
Foi implementada uma análise de sensibilidade com diferentes especificações das distribuições à priori (baseadas na literatura). Os resultados apresentados (M1 a M7) correspondem à configuração que demonstrou melhor e mais consistente ajuste aos dados (DIC).
Efeitos fixos
Para a tendência global especificou-se uma distribuição gaussiana não-informativa de média nula e precisão \(\tau= 1/\sigma^2=\) 0.01. \[ \alpha \sim N(0, 100) \]
Para o parâmetro associado ao índice EDI especificou-se uma prior informativa com distribuição gaussiana:
\[ \beta_{EDI} \sim N(0.15, 1.43) \]
assumindo à priori a expectativa de uma associação positiva entre a privação socio-económica e a mortalidade infantil (espera-se que quanto maior for o valor do índice, maior será o RR).
Efeitos aleatórios
As distribuições a priori para os hiperparâmetros dos efeitos aleatórios foram especificadas usando priors de complexidade penalizada7 (PC priors).
Para a componente espacial (\(u_i+v_i\)) adoptou-se o modelo BYM2 (Besag-York-Mollié) especificado com uma combinação de priors com componente estruturada, \(u_i\), e componente não-estruturada, \(v_i\), onde \(u_i\) segue um modelo condicional autoregressivo intrinseco (iCAR) e \(v_i\) segue uma distribuição gaussiana de média nula e variancia unitária. Este modelo parametriza esta soma em termos de uma precisão marginal e um parâmetro de mistura que controla a proporção da variância atribuída à componente estruturada. Para o desvio padrão marginal (inversa da precisão) desta compontente, \(\sigma_{u+v}\), especificou-se uma PC prior com probabilidade 80% do desvio-padrão ser maior que 0.5:
\[ P(\sigma_{u+v}>0.5)= 0.8 \]
Esta especificação favorece uma baixa variabilidade espacial no contexto do RR.
Para o parâmetro de mistura do modelo BYM2, \(\rho\) especificou-se uma PC prior que reflete a convição à priori de que a componente de dependência espacial (estruturada) é moderadamente mais relevante que a heterogeneidade não estruturada na explicação da variabilidade do RR entre concelhos. Especificamente, atribuiu-se 10% de probabilidade a priori de que a proporção da variância espacial explicada pela componente estruturada ser 0.5.
\[ P(\rho> 0.5)=0.1 \]
Para a estrutura temporal especificou-se um passeio aleatório de primeira ordem (RW1) com erros aleatórios, \(\epsilon\), gaussianos com média nula e variância unitária:
\[ \gamma_j = \gamma_{j-1}+ \epsilon_j \]
Para o desvio padrão marginal das diferenças temporais, especificou-se uma PC prior que favorece uma evolução temporal suave, com apenas 15% de probabilidade a priori de o desvio padrão das inovações exceder 0.5:
\[ P(\sigma_{\gamma}>0.5)=0.15 \]
3 Resultados
3.1 Mortalidade infantil
A taxa de mortalidade infantil (TMI) anual observada foi a seguinte:
Em termos globais, e até ao ano de 2021, a evolução da taxa anual de mortalidade infantil evidenciou uma tendência de decréscimo. No entanto, a partir desse ano a tendência inverteu-se e, desde então, as taxas anuais de mortalidade infantil têm vindo a aumentar.

No gráfico seguinte apresentam-se as séries temporais, por concelho. Ilustram-se algumas séries temporais com cores, para evidenciar que TMI anuais muito elevadas (e.g. superiores a 10 por 1000 nados-vivos) tendem a ocorrer em concelhos pouco povoados, com baixo número de nascimentos (e.g Mora, Fornos de Algodres), enquanto que em concelhos com muitos nascimentos (e.g. Lisboa ou Porto), as TMI são mais baixas e mais estáveis.

Na tabela seguinte apresentam-se as TMI anuais médias, estratificadas pelo índice de privação (EDI) que se apresenta agrupado da seguinte forma:
- Grupo 1, concelhos com valor EDI no 1º quintil (0-20) (menor privação),
- Grupo 2, concelhos com valor EDI no 2º quintil (20-40),
- Grupo 3, concelhos com valor EDI no 3º quintil (40-60),
- Grupo 4, concelhos com valor EDI no 4º quintil (60-80),
- Grupo 5, concelhos com valor EDI no 5º quintil (80-100) (maior privação).
Na tabela seguinte mostram-se as TMI médias obtidas em cada grupo e ano.
| EDI (Quintil) | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 | 2024 |
|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 3.26 | 3.92 | 2.11 | 1.73 | 3.19 | 3.11 | 0.71 | 1.32 | 2.56 | 2.16 |
| 2 | 2.59 | 3.16 | 2.50 | 1.42 | 1.35 | 2.85 | 2.31 | 2.58 | 4.01 | 3.38 |
| 3 | 3.24 | 2.97 | 3.65 | 4.40 | 3.06 | 0.78 | 2.62 | 2.51 | 0.74 | 4.27 |
| 4 | 2.82 | 4.24 | 2.75 | 2.14 | 3.36 | 2.62 | 3.71 | 3.08 | 1.96 | 4.16 |
| 5 | 3.79 | 2.36 | 2.33 | 3.66 | 3.12 | 3.21 | 1.68 | 2.08 | 3.24 | 2.06 |
Na figura seguinte apresentam-se os valores do índice EDI nos concelhos projectados no mapa de Portugal, por quintil. Observa-se uma tendência para maior concentração de índices de privação socio-económica mais baixos (concelhos no quintil 1) na região norte e de índices de privação mais elevados (concelhos no quintil 5) na região sul.

Com base nos dados observados de mortalidade infantil apresentados, procedeu-se à modelação Bayesiana espacial e temporal para estimar os RRs de mortalidade infantil nos concelhos de Portugal Continental. A análise de diferentes especificações de modelos (M1-M7) írá contribuir para avaliar o impacto da componente espacial, temporal e da privação socioeconómica (indice EDI) na variabilidade observada nas TMI.
3.2 Risco relativo
Para os modelos ajustados (M1-M7) com priors especificadas na Secção 2.2.2 apresentam-se na tabela seguinte os resultados obtidos com as medidas de ajustamento Deviance Information Criterion (DIC) e Watanabe-Akaike Information Criterion (WAIC).
| Modelo | DIC | WAIC |
|---|---|---|
| M1 | 4611.18 | 4611.71 |
| M2 | 4557.06 | 4562.55 |
| M3 | 4549.16 | 4551.87 |
| M4 | 4549.79 | 4551.89 |
| M5 | 4554.13 | 4559.98 |
| M6 | 4545.76 | 4548.46 |
| M7 | 4546.65 | 4548.70 |
A partir da tabela observa-se que os modelos M2-M7 apresentam melhores ajustamentos que M1 - o único modelo que inclui apenas efeitos globais. Observa-se também que, com a integração da covariável EDI (M5-M7), a qualidade do ajustamento melhora em relação a (M2-M4). O melhor desempenho observa-se nos modelos M6 e M7 mas sugere que a inclusão de um termo de interação com a componente espacial (M7) não traz melhorias relevantes em relação ao modelo sem interação (M6).
Para facilitar a interpretação dos resultados, opta-se por apresentar no resto desta secção apenas os modelos M1, M2 e M6. Estes três modelos ilustram a evolução da complexidade: M1 como modelo base (evolução global), M2 com componentes espacial e temporal (global e local), e M6 com as componentes espacial, temporal e a covariável de privação socioeconómica.
3.2.1 Modelo M1
O modelo M1 especifica um efeito temporal global, \(\beta\), como preditor linear do (log) risco relativo, \(\log(\theta_{ij})\), da mortalidade no concelho \(i\) e ano \(j\):
\[\log(\theta_{ij})=\alpha+\beta t_j\]
onde,
- \(\alpha\) representa a ordenada na origem;
- \(\beta\) representa a tendência linear temporal (impacto global, i.e., independente do concelho);
- \(t_j\) representa o índice temporal correspondente ao ano \(j\);
Embora o resultado dos últimos anos (2021-2024) aponte para um aumento da taxa de mortalidade infantil, o resultado do modelo M1 sugere que se mantém a tendência global de redução significativa do risco relativo ao longo periodo analisado de 2% (\(\exp(\beta) \approx 0.9801987\)). O intervalo de credibilidade de 95% da distribuição à posteriori dos parâmetros obtidos para M1 apresentam-se na tabela seguinte:
| mean | sd | 0.025quant | 0.5quant | 0.975quant | |
|---|---|---|---|---|---|
| α | 0.099 | 0.044 | 0.013 | 0.099 | 0.186 |
| β | -0.018 | 0.007 | -0.033 | -0.018 | -0.004 |
No gráfico seguinte ilustra-se o efeito global do tempo na variação do risco relativo da mortalidade infantil, representada pela média da distribuição à posteriori de \(\beta\), e respetivos limites inferior e superior (linhas tracejadas) para um intervalo de credibilidade de 95%.

Será consensual considerar que um dos problemas de M1 é o de ser linear e não conseguir captar a tendência de aumento acentuado observado nos últimos anos. Nas secções seguintes serão analisados os modelo M2 e M6, onde se adicionam a componente espacial e temporal (com os efeitos global e local) para avaliar o impacto na variação da mortalidade infantil observada.
3.2.2 Modelo M2
No modelo M2 ajustou-se um efeito aleatório das componentes espacial - \(u_i + v_i\) - e temporal - \(\beta + \delta_i\) -, onde \(u_i\) e \(v_i\) representam a componente espacial estruturada e não-estruturada, \(\beta\) representa a tendência global e linear ao longo do tempo e \(\delta_i\) representa a interação entre o tempo e o espaço (i.e. o concelho \(i\)), ou seja, a diferença entre a tendência temporal global (\(\beta\)) e a tendência temporal específica de cada concelho.
\[ \log(\theta_{ij})=\alpha+u_i+v_i+(\beta+\delta_i)* t_j \]
O mapa seguinte ilustra as estimativas obtidas para \(\exp(\delta_i)\) com o modelo M2, em cada concelho e referem-se à média da distribuição à posteriori de \(\exp(\delta_i)\) obtida em cada concelho. A função exponencial aplicada a \(\delta_i\) representa o efeito (multiplicativo) do concelho \(i\) em relação à tendência temporal média de mortalidade infantil esperada para o país.